[t:/]$ 지식_

Spark로 하는 고속 빅데이터 분석과 처리

2015/01/03

입문서이다. 에이콘 출판사.

Spark의 가장 기초부터 기본 활용까지 다뤘다.

따로 어려운 점은 없으나 스칼라와 자바 중심이다.

나는 주요 꼭지만 봤는데 대부분 아는 것이라 죽죽 넘겨봤다.

파이썬 개발자라면 다른 책을 추천한다. 스파크 책 많다.

다만 현 시점에서 파이썬은 성능 문제가 좀 있다. 특히 UDF라도 쓰면 마샬/언마샬 비용이 엄청나다.

언어간 데이터 형변환 등에서 많은 시간을 소모한다. yarn dag 를 보면 그렇다.









[t:/] is not "technology - root". dawnsea, rss